FILTER MODE ACTIVE

#вычислительная эффективность

Найдено записей: 4

#вычислительная эффективность07.07.2025

Радиальное внимание: снижение затрат на видео-диффузию в 4,4 раза без потери качества

Радиальное внимание представляет новый механизм разреженного внимания, который сокращает затраты на обучение в 4,4 раза и время инференса в 3,7 раза в видео-диффузионных моделях, позволяя создавать более длинные видео без потери качества.

#вычислительная эффективность15.06.2025

OThink-R1: Интеллектуальная двухрежимная система рассуждений для сокращения избыточных вычислений в больших языковых моделях

OThink-R1 предлагает инновационный подход для больших языковых моделей, позволяющий переключаться между быстрым и медленным рассуждением, сокращая избыточные вычисления на 23% без потери точности.

#вычислительная эффективность17.05.2025

DeepSeek-V3: Революция в языковых моделях через эффективность и масштабируемость

DeepSeek-V3 предлагает инновационную архитектуру и аппаратно-согласованный дизайн, значительно повышающие эффективность и масштабируемость больших языковых моделей, делая передовой ИИ более доступным.

#вычислительная эффективность27.04.2025

Оптимизация производительности рассуждений: подробный анализ методов масштабирования во время инференса в языковых моделях

Новое исследование демонстрирует, что специализированные модели рассуждений с эффективными методами масштабирования во время инференса, такими как голосование большинства, превосходят общие модели в сложных задачах, открывая пути к оптимизации ресурсов.